Conjunto de datos

Los datos fueron recolectados a través de un proceso de raspado (webscraping) siguiendo una primera versión de una clasificación taxonómica que tratara de extraer los tweets más relevantes para el análisis.

Las variables que se tuvieron en cuenta fueron: el identificador único del tweet (id), el momento en que fue creado (Created_At) y su contenido (Text); de modo que el nombre de las cuentas

ID Created_At Text
220208944646332416 2012-07-03T17:34:38 Lo de la chica baleada en Isidro Casanova..que lamentablemente perdio su embarazo..tambien dicen ahora que es ajuste de cuentas??
190155839590498304 2012-04-11T19:14:19 Ajuste en sanidad II. No se aplicarán técnicas de reproducción asistida salvo que el embarazo no sea posible de forma natural, poco ahorro.
17963422655 2010-07-07T16:57:04 “La palabra clave para lograr el adecuado ajuste al embarazo es: APOYO… Familiar, pareja y del sistema de salud” Lcda. Lecuna. Curso CANIA
608011196185366529 2015-06-08T20:42:20 “las mujeres se embarazan para cobrar la AUH”Pero el embarazo en mujeres menores de 20 años se mantiene desde 2007 en 15,6. Ajuste es #PRO
592815489686118401 2015-04-27T22:20:01 Kit de Ajuste: 2 extensores + 1 banda de algodón, para usar la ropa pre-embarazo en los primeros meses de embarazo. pic.twitter.com/82FEIqxF9P
592706483793559554 2015-04-27T15:06:52 Aun estando embarazada puedes recibir un ajuste de columna, en la etapa de embarazo es necesario un ajuste vertebral, Higiene es Salud!

\(~\)

A continuación se muestra el intervalo de tiempo del conjunto de datos, ¡un total de 41.879 tweets para casi 7 años!

Figura 1. Temporalidad de los Tweets

Como se observa, hay un pico de tweets por minuto interesante el día 20 de marzo de 2015 cerca de las 10pm. Estos son algunos de los tweets que se publicaron alrededor de esa hora:

## [1] "OMS recomienda aplazar 6 meses embarazo en caso de zika: La entidad que establece las normas sanitarias inter... http://bit.ly/1RIrKQG "                                                                                                                                                                                                                                 
## [2] "OMS recomienda aplazar 6 meses embarazo en caso de zika: La entidad que establece las normas sanitarias inter... http://bit.ly/1RIrKQG "                                                                                                                                                                                                                                 
## [3] "Sí, aún peor. En mi anterior embarazo trabajaba en Chile y allí la baja maternal es más larga. Se niegan a escuchar a quienes realmente saben del tema. La Asoc. Esp de Pediatría recomienda baja maternal de 6 meses pero ellos ponen los votos por encima de la salud de los bebés."                                                                                   
## [4] "https://www.who.int/reproductivehealth/publications/unsafe_abortion/clinical-practice-safe-abortion/es/ …\nLe recomiendo leerlo para que se informe, hay muchos tipos de aborto y estos son los avalados por la OMS, la lucha de las mujeres es justa, así se evitan embarazos no deseados que producen muchos problemas a la larga , y complicaciones en el embarazo :)"
## [5] "Les recomiendo este canal de YouTube, todos los días le llegan mensajes de jóvenes con dudas sobre embarazo adolescente, periodo menstrual, métodos anticonceptivos y una larga lista. https://www.youtube.com/channel/UCzRZG8btZbf3yZa6PhQvP5g …"                                                                                                                       
## [6] "Si el embarazo tiene mas de 12 semanas les recomiendo legrado, el gajo de cebolla larga es foco de sepsis #Abortips"

Frecuencias de palabras

Una forma intuitiva de analizar datos en formato de texto, es a través de la visualización de las palabras más populares:

Adicional al gráfico de barras anterior, las nubes de palabras son otro tipo de visualización para este tipo de datos. Sin embargo, en este análisis hay una gran desproporción entre las palabras más populares, evidenciado por la forma del gráfico:

Este caso es un ejemplo de que tal vez las palabras que más aparecen no sean las que poseen más importancia para el significado del texto. Un modo de abordar este problema es con la ponderación de las palabras con un método conocido como TF-IDF, que castiga aquellas palabras que aparecen en demacía pero no en proporción a la totalidad de documentos, en este caso Tweets.

Luego de realizar la ponderación la nueva jerarquía es la siguiente:

Como se observa la palabra “mes” aparece en primer lugar, en vez de embarazo.

Se realizó el mismo procedimiento para la nube de palabras, y es evidente a primera vista que las palabras se visualizan de mejor manera:

\(~\)

Análisis de redes

El análisis de redes es un conjunto de técnicas integradas que permiten extraer las relaciones entre diferentes actores y analizar las estructuras sociales que emergen de sus interacciones.

En primer lugar se deben extraer las palabras que más se utilizan de forma conjunta, o más conocidas como n-gramas. Para esta sección se construyeron las redes a partir del procedimiento más común, tomando los bi-gramas:

## # A tibble: 6 x 3
##   word1      word2    weight
##   <chr>      <chr>     <int>
## 1 mes        embarazo   8761
## 2 embarazo   deseado    5391
## 3 embarazo   planeado   4521
## 4 prevencion embarazo   1899
## 5 embarazo   mes        1282
## 6 hormonal   embarazo    812

A cada par de palabras se le asignó un peso, que se verá reflejado en la red por la cercanía con otros conjuntos de palabras, como en el siguiente gráfico:

Pero este gráfico puede visualizar mucha más información, y para ello se construyó una versión interactiva:

Una variación de esta red se construyó utilziando ‘skip-grams’ en lugar de bi-gramas. Esta aproximación intenta solventar el problema en donde las palabras que están una al lado de otra tal vez no nos cuentan la historia completa, de modo que los ski-grams intentan ubicar las combinaciones de palabras que sí le dan significado al texto:

Detección de comunidades

Este procedimiento consiste en identificar grupos de nodos de una red que interactúan entre sí, evidenciando grupos de palabras que tocan temas en común:

Como se observa con la codificación de colores, hay grupos de palabras que pertenecen a un mismo grupo de tweets, y que en consecuencia, pertenecen a diferentes personas que hablan sobre un mismo tema.

Estas son las palabras que aparecen en cada grupo o cluster:

##  [1] "hice, termine, notas, secundario, cargo, excelentes, hijo, corta, estudiar, casa, lpmyo, hija, maridoahora, asignacion, cargopia"       
##  [2] "embarazada, segui, arta, tema, abortoquede, quedar, mujer, quedo, amor, quedarte, quede, quedarse, queda, debo, luz"                    
##  [3] "tenian, terapia, asimilar, novio, silvia, toman, navarro, iftttxniqw"                                                                   
##  [4] "transmision, educacion, enfermedades, infecciones, sexual"                                                                              
##  [5] "hormonal, madre, desequilibrio, autismo, cambio, estudio, relaciona, ansiedad, depresion, tratamiento, revolucion, relacionan, desorden"
##  [6] "regular, ninos, afectar, capacidad, ejercicio, forma, consumo, practica, conductas, fisico"                                             
##  [7] "metodo, aborto, ningun, legal, algun, seguro, eficaz, efectivo, espontaneo"                                                             
##  [8] "duracion, variar, larga"                                                                                                                
##  [9] "mes, embarazo, prevencion, evitar, meses, prevenir, sexto, tercer, interrupcion, quinto, septimo, octavo, cuarto, prueba, planeado"     
## [10] "acido, folico"                                                                                                                          
## [11] "hormona, kgs, sepas, cura, sobrepeso, bajas, hcg"                                                                                       
## [12] "eco, importante, realices"                                                                                                              
## [13] "kourtney, kardashian"                                                                                                                   
## [14] "puedes, tranquilo, puta"                                                                                                                
## [15] "bebe, sexo, test, evita, tomar, alcohol, toma, lactancia, tambien, dispositivo, desarrollo, crecimiento, allen, pierde, diferencia"     
## [16] "cuidarte, facil"                                                                                                                        
## [17] "control, recomienda, tendras, bebelucomve"

Análisis de correlaciones

Este es un método estadístico que tiene el propósito de evaluar la fuerza de la relación entre varias variables, en este caso, se seleccionan palabras y se detectan aquellas con las que se suelen emparejar:

Conclusiones